## (12) NACH DEM VERTRAG ÜBER DIE INTERNATIONALE ZUSAMMENARBEIT AUF DEM GEBIET DES PATENTWESENS (PCT) VERÖFFENTLICHTE INTERNATIONALE ANMELDUNG

(19) Weltorganisation für geistiges Eigentum Internationales Büro



## 

(43) Internationales Veröffentlichungsdatum 27. März 2003 (27.03.2003)

**PCT** 

# (10) Internationale Veröffentlichungsnummer WO 03/025781 A2

|   | (51)                                                             | ) Internationale Patentklassifikation <sup>7</sup> : G06F |                                      | G06F 1       | 5/76 |
|---|------------------------------------------------------------------|-----------------------------------------------------------|--------------------------------------|--------------|------|
|   | (21)                                                             | Internationales A                                         | Aktenzeichen:                        | PCT/EP02/10  | 0479 |
|   | (22) Internationales Anmeldedatum: 18. September 2002 (18.09.200 |                                                           |                                      |              |      |
|   | (25)                                                             | Einreichungssprache: ) Veröffentlichungssprache:          |                                      | Deutsch      |      |
|   | (26)                                                             |                                                           |                                      | Deutsch      |      |
|   | (30) Angaben zur Priorität:                                      |                                                           |                                      |              |      |
|   |                                                                  | 101 46 132.1                                              | 19. September 2001 (                 | 19.09.2001)  | DE   |
|   |                                                                  | 09/967,497                                                | 28. September 2001 (                 |              | US   |
|   |                                                                  | PCT/EP01/11299                                            |                                      | ,            |      |
|   |                                                                  |                                                           | 30. September 2001 (                 | 30.09.2001)  | EP   |
|   |                                                                  | PCT/EP01/11593                                            |                                      |              | EP   |
|   |                                                                  | 101 54 259.3                                              | 5. November 2001 (                   |              | DE   |
| • |                                                                  | 01129923.7                                                | 14. Dezember 2001 (                  | ,            | EP   |
|   |                                                                  | 02001331.4                                                | 18. Januar 2002 (                    |              | EP   |
|   |                                                                  | 102 06 653.1                                              | 15. Februar 2002 (                   | 15.02.2002)  | DE   |
|   |                                                                  | 102 06 857.7                                              | 18. Februar 2002 (                   | 18.02.2002)  | DE   |
|   |                                                                  | 102 06 856.9                                              | 18. Februar 2002 (                   | 18.02.2002)  | DE   |
|   |                                                                  | 102 07 224.8                                              | 21. Februar 2002 (                   | 21.02.2002)  | DE   |
|   |                                                                  | 102 07 226.4                                              | 21. Februar 2002 (                   | 21.02.2002)  | DE   |
| i |                                                                  | 102 08 435.1                                              | 27. Februar 2002 (                   | 27.02.2002)  | DE   |
|   |                                                                  | 102 08 434.3                                              | 27. Februar 2002 (                   | 27.02.2002)  | DE   |
| Ē |                                                                  | PCT/EP02/02402                                            | 5. März 2002 (                       | (05.03.2002) | EP   |
|   |                                                                  | PCT/EP02/02403                                            | 5. März 2002 (                       | (05.03.2002) | EP   |
|   |                                                                  | PCT/EP02/02398                                            | 5. März 2002 (                       | (05.03.2002) | EP   |
| i |                                                                  | 102 12 622.4                                              | 21. März 2002 (                      | 21.03.2002)  | DE   |
| Ē |                                                                  | 102 12 621.6                                              | 21. März 2002 (                      |              | DE   |
| = |                                                                  | 102 19 681.8                                              | 2. Mai 2002 (                        | 02.05.2002)  | DE   |
| į |                                                                  | 02009868.7                                                | 2. Mai 2002                          | •            | EP   |
|   |                                                                  | 102 26 186.5                                              | 12. Juni 2002 (                      |              | DE   |
| Ī |                                                                  | 102 27 650.1                                              | 20. Juni 2002 (                      |              | DE   |
| = |                                                                  | 102 36 271.8                                              | 7. August 2002 (                     | ,            | DE   |
| Ĩ |                                                                  | 102 38 174.7                                              | 21. August 2002 (                    |              | DE   |
| i |                                                                  | 102 40 022.9                                              | 27. August 2002 (                    | ,            | DE   |
|   |                                                                  | 102 40 000.8                                              | 27. August 2002 (                    | (27.08.2002) | DE   |
| Ē |                                                                  | PCT/DE02/0327                                             | =                                    |              |      |
|   |                                                                  | PCT/EP02/10084                                            | <ol> <li>September 2002 (</li> </ol> | (03.09.2002) | DE   |
|   |                                                                  |                                                           | •                                    |              |      |

9. September 2002 (09.09.2002)

- (71) Anmelder (für alle Bestimmungsstaaten mit Ausnahme von US): PACT XPP TECHNOLOGIES AG [DE/DE]; Muthmannstrasse 1, 80939 München (DE).
- (72) Erfinder; und
- (75) Erfinder/Anmelder (nur für US): VORBACH, Martin [DE/DE]; Gotthardstrasse 117 a, 80689 München (DE). BRETZ, Daniel [DE/DE]; Georgenstrasse 115, 80798 München (DE).
- (74) Anwalt: PIETRUK, Claus, Peter; Heinrich-Lilienfein-Weg 5, 76229 Karlsruhe (DE).
- (81) Bestimmungsstaaten (national): AE, AG, AL, AM, AT (Gebrauchsmuster), AT, AU, AZ, BA, BB, BG, BR, BY, BZ, CA, CH, CN, CO, CR, CU, CZ, DE (Gebrauchsmuster), DE, DK, DM, DZ, EC, EE, ES, FI, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MA, MD, MG, MK, MN, MW, MX, MZ, NO, NZ, OM, PH, PL, PT, RO, RU, SD, SE, SG, SI, SK, SL, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, YU, ZA, ZM, ZW.
- (84) Bestimmungsstaaten (regional): ARIPO-Patent (GH, GM, KE, LS, MW, MZ, SD, SL, SZ, TZ, UG, ZM, ZW), eurasisches Patent (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM), europäisches Patent (AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE, SK, TR), OAPI-Patent (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).

#### Erklärung gemäß Regel 4.17:

hinsichtlich der Berechtigung des Anmelders, ein Patent zu beantragen und zu erhalten (Regel 4.17 Ziffer ii) für die folgenden Bestimmungsstaaten AE, AG, AL, AM, AT, AU, AZ, BA, BB, BG, BR, BY, BZ, CA, CH, CN, CO, CR, CU, CZ, DE, DK, DM, DZ, EC, EE, ES, FI, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MA, MD, MG, MK, MN, MW, MX, MZ, NO, NZ, OM, PH, PL, PT, RO, RU, SD, SE, SG, SI, SK, SL, TJ, TM, TN, TR, TT, TZ, UA, UG, UZ, VC, VN, YU, ZA, ZM, ZW, ARIPO-Patent (GH, GM, KE, LS, MW, MZ, SD, SL, SZ, TZ, UG, ZM, ZW), eurasisches Patent (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM), europäisches Patent (AT, BE,

[Fortsetzung auf der nächsten Seite]

(54) Title: ROUTER

(54) Bezeichnung: ROUTER

(57) Abstract: The invention relates to improvements in the configuration of reconfigurable multi-dimensional fields. Amongst others, specifications for the handling of back-couplings are given.

(57) Zusammenfassung: Die Erfindung betrifft Verbesserungen bei der Konfiguration rekonfigurierbarer multidimensionalen Feldern. Es werden unter anderem Angaben zur Behandlung von Rückkopplungen gemacht.



2

### WO 03/025781 A2



BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE, SK, TR), OAPI-Patent (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG)

Zur Erklärung der Zweibuchstaben-Codes und der anderen Abkürzungen wird auf die Erklärungen ("Guidance Notes on Codes and Abbreviations") am Anfang jeder regulären Ausgabe der PCT-Gazette verwiesen.

#### Veröffentlicht:

 ohne internationalen Recherchenbericht und erneut zu veröffentlichen nach Erhalt des Berichts

Router

Beschreibung

5

Die Erfindung betrifft das oberbegrifflich Beanspruchte und befaßt sich somit mit konfigurierbaren Bausteinen und dergleichen und hier insbesondere mit dem Verwalten der Datenströme in diesen insbesondere dem Plazieren von Ressourcen und dem Routing von Verbindungen zwischen Zellen usw..

Es sind bereits multidimensionale Felder aus datenverarbeitenden Zellen bekannt. Zur Gattung dieser Bausteine zählen insbesondere systolische Arrays, neuronale Netze, Mehrprozessor Systeme, Prozessoren mit mehreren Rechenwerken und/oder logischen Zellen und/oder kommunikativen/peripheren Zellen (IO), Vernetzungs- und Netzwerkbausteine wie z.B. Crossbar-Schalter, ebenso wie bekannte Bausteine der Gattung FPGA, DPGA, Chameleon, XPUTER, etc.. Es sind insbesondere Bausteine bekannt, bei denen erste Zellen während der Laufzeit ohne Störung des Betriebes weiterer Zellen umkonfigurierbar sind, vgl. etwa die folgenden Schutzrechte und Anmeldungen desselben Anmelders: P 44 16 881.0-53, DE 197 81 412.3, DE 197 81 25 483.2, DE 196 54 846.2-53, DE 196 54 593.5-53, DE 197 04 044.6-53, DE 198 80 129.7, DE 198 61 088.2-53, DE 199 80 312.9, PCT/DE 00/01869, DE 100 36 627.9-33, DE 100 28 397.7, DE 101 10 530.4, DE 101 11 014.6, PCT/EP 00/10516, EP 01 102 674.7. Diese sind hiermit zu Of-30 fenbarungszwecken vollumfänglich eingegliedert. Hingewiesen wird weiter auf die Chameleon-Systems-Prozessor-Architektur. Die Brauchbarkeit der letztgenannten Konstruktion zu Daten-

verarbeitungszwecken ist jedoch eher vergleichbar mit einer Anordnung gemäß DE 101 03 624 A1.

Die datenverarbeitenden Zellen dieser Bausteine können nun 5 unterschiedlichen Funktionen ausführen, etwa Bool'sche und/oder arithmetisch Verknüpfungen von Eingangs-Operanden bewirken. Zwischen den Zellen verlaufen Verbindungen, die gleichfalls einstellbar sind, typisch etwa Busse, die auf verschiedene Weise eine Vernetzung bewirken können und so ein in seiner Vernetzung einstellbares multidimensionales Feld aufbauen. Über die Busse oder anderen Leitungen tauschen die Zellen miteinander wie erforderlich Informationen aus, etwa Statussignale, Trigger oder die zu verarbeitenden Daten. Typisch sind dabei in einem zweidimensionalen Prozessorfeld etwa die Zellen Reihen- und spaltenweise angeordnet, wobei die Ausgänge von Zellen einer ersten Reihe auf Busse geführt, an die zugleich die Eingänge der Zellen der nächsten Reihe zu koppeln sind. Bei einer bekannten Anordnung (Pact XPP) sind zudem Vorwärts- und Rückwärtsregister vorgesehen, um Daten unter Umgehung von Zellen auf Bussysteme anderer Reihen zu leiten, ein Balancing von parallel auszuführenden Zweigen zu erreichen, usw. Es ist auch schon vorgeschlagen worden, derartige Vor- und/oder Rückwärtsregister mit einer über den reinen Datentransfer hinausgehenden Funktionalität zu verse-25 hen.

Allgemein muß aber festgelegt werden, welche Zelle welche Datenverarbeitungsschritte durchführt, wo diese Zelle liegt und wie sie verbunden wird. Nach dem Stand der Technik sind bereits Strategien zur automatischen Steuerung von Plazierungsund Routingmechanismen bekannt.

Typischerweise arbeiten etwa Placer nach einem Kräfteverfahren, das Kräfte zwischen Zellen zur optimalen Plazierung abhängiger Zellen verwendet, indem Verbindungen durch Federn in
einem physikalischen Modell simuliert werden. Dadurch entsteht in der Regel ein zumeist geeignetes Plazierungsergebnis.

Weiterhin sind aus P 44 16 881.0-53, DE 196 54 846.2-53, DE 102 06 653.1 Datenverarbeitungsverfahren für umkonfigurierbare Bausteine bekannt, bei welchen die Daten in jedem Verarbeitungsschritt von einem oder mehreren Speichern gelesen werden, verarbeitet werden und in einen oder mehrere Speicher geschrieben werden. Nach dem Stand der Technik sind die Schreib- und Lesespeicher unterschiedlich und typischerweise gegenüberliegend plaziert. (Figur xxua, xxub, xxuc, sowie vgl. DE 102 06 653.1 Figur 3).

Ebenfalls bekannt sind aus DE 197 04 728.9, DE 199 26 538.0, DE 100 28 397.7 spezielle Rekonfigurationsverfahren (Wave-Reconfiguration) für die genannten Bausteine bekannt, die eine besonders effiziente Rekonfiguration dadurch ermöglichen, dass die Rekonfigurationsinformation mit den letzten zu verarbeitenden Daten über die Daten- und/oder Triggerbusse mitübertragen wird und direkt nach erfolgter Verarbeitung die Busse und Zellen neu konfiguriert werden.

Um eine bestimmte Art der Datenverarbeitung durchzuführen, muß jeder Zelle eine bestimmte Funktion zugewiesen werden und es ist zugleich eine geeignete räumliche Lage und Vernetzung vorzusehen. Es muß dazu, bevor das multidimensionale Prozessorfeld Daten wie gewünscht verarbeitet, also festgelegt werden, welche Zelle welche Funktion ausführen soll, wobei für

jede an einer Datenverarbeitungsaufgabe beteiligte Zelle eine Funktion festzulegen ist und es muß die Vernetzung bestimmt werden. Dabei

5 Die Aufgabe der vorliegenden Erfindung besteht darin, Neues für die gewerbliche Anwendung bereitzustellen.

Die Lösung der Aufgabe wird unabhängig beansprucht. Bevorzugte Ausführungsformen finden sich in den Unteransprüchen.

10

Beschrieben wird dabei zunächst ein Verfahren zur Erzeugung von Konfigurationen für multidimensionale Felder rekonfigurierbarer Zellen zur Durchführung vorgegebener Anwendungen, bei dem eine Anwendung in Einzelmodule zerlegt und eine modulweise Plazierung der zur Durchführung erforderlichen Elemente vorgenommen wird. Eine solche Modulzerlegung ist vorteilhaft, weil dann für diese Modulen einfacher Konfigurationen bestimmt werden können.

Besonders bevorzugt ist es, wenn bei dem Verfahren, wenn zumindest in einem Modul ortsfeste Elemente vorhanden sind, diese an vorgegebenen Stellen vorgesehen werden und die nichtfesten Elemente nachfolgend plaziert werden. Es ist dann möglich, daß die modulweise Plazierung durch Minimierung zugewiesener virtueller Kräfte unter den einzelnen beweglichen und/oder unbeweglichen Objekten erfolgt.

In der Regel ist es auch wünschenswert, die Funktion und Vernetzung so anzuordnen, daß die Datenverarbeitung möglichst

zügig und/oder ressourcenschonend erfolgen kann. Oftmals ist
es jedoch, etwa aufgrund von Hardware-Beschränkungen, nicht

möglich, eine Anordnung zu finden, die den gewünschten Datentransfer in optimaler Weise gewährleistet. Es müssen dann suboptimale Anordnungen verwendet werden.

5 Es wird nun erfindungsgemäß weiter vorgeschlagen, zur Verbesserung der Konfiguration für multidimensionale Felder rekonfigurierbar vernetzter Datenverarbeitungszellen, dass benötigte Verbindungen zwischen Zellen priorisiert, dann zunächst Verbindungen, die eine hohe Priorität besitzen und nachfolgend weitere Verbindungen vorgesehen werden.

Auf diese Weise wird die Verwendung suboptimaler Anordnungen schon dadurch minimiert, daß sichergestellt ist, daß über etwa aufgrund einer benötigten hohen geringen Latenzzeit etc.

15 besonders wichtige Verbindungen Daten mit geringeren Beschränkungen durch Ressourcenknappheit wie eine beschränkte Buszahl etc. strömen können.

Es ist daher auch bevorzugt möglich, daß Verbindungen gerade

20 unter Berücksichtigung einer zulässigen Verzögerung bei der

Datenverarbeitung priorisiert werden. Die Priorisierung kann

unter Berücksichtigung der maximal zulässigen Verzögerung

und/oder der Verzögerungsverhältnisse unterschiedlicher Ver
bindungen vorgenommen werden. Als Verzögerungsverhältnisse

25 ist bei der Priorisierung bevorzugt eine Verzögerung "O",

"länger als", "länger als oder gleich zu" und "gleich zu"

berücksichtigen.

Die Verbindungen zwischen den Zellen einer Konfiguration wer30 den dabei etwa so erzeugt, daß eine Zellumgrenzung definiert
und zunächst versucht wird, die Zellen über Verbindungen innerhalb der Umgrenzung zu verbinden. Dies wird mit Bezug auf

die Fig. la und b gezeigt, wo für eine XPP-Architektur des Anmelders die PAE-Zellen langgestreckt und von als "FR" und "BR" bezeichneten Vorwärts- bzw. Rückwärts-Registern flankiert dargestellt sind. Ein Feldteil ist von einer gestrichelten Linie umgrenzt, die die Umgrenzung darstellt. Typisch wird bei einem Routeversuch erst in X-Richtung, also horizontal von Start- zu Zielzelle fortgeschritten und dann, sofern in einer Reihe in X-Richtung kein Fortkommen mehr möglich ist, etwa weil keine geeigneten Busse mehr verfügbar sind, wird die Reihe in y-Richtung gewechselt. Fig. 1b zeigt dabei ein Beispiel für eine mögliche Verbindungsleitung, wenn zwischen gegebenen Zellen keine unmittelbare Verbindung mehr möglich ist.

Es ist möglich, daß dann, wenn nicht alle erforderlichen Verbindungen innerhalb der Umgrenzung vorgesehen werden können, eine Verbindung außerhalb der Umgebung vorgesehen wird. Dann, wenn eine weitere Verbindung nicht wie erforderlich gelegt werden kann, soll in beiden Fällen, also inner- oder außer20 halb, eine bereits vorgesehene Verbindung getrennt und die weitere Verbindung vorgesehen wird, worauf versucht wird, eienn Ersatz für die getrennte Verbindung vorzusehen. Bevorzugt wird jedoch mit dem Überschreiten der Umgrenzung solange zugewartet, bis feststeht, daß auch durch Auftrennung keine
25 Verbindungen zusätzlich innerhalb der Umgrenzung legbar sind.

ES ist möglich, daß Verbindungen vorgesehen werden, auf welchen sich eine Vielzahl von Ausgängen sammeln und die mit einer Vielzahl von Eingängen verbunden sind, wobei eine Verbindung so vorgesehen wird, dass ein Wegstück die Eingangssammelpunkte und die Ausgangsgabelungen trennt. Dies ist in den Figuren 2 bis 4 veranschaulicht, die zeigen, wie zulässige

und unzulässige Verbindungen aussehen können. Fig. 2 zeigt dabei allgemein, wie Daten aus einem Outputport, d.h. einem Ausgangsanschluß an einem Sammelpunkt zusammenlaufen, Pfeil "A" und wie dies an einem Eingang einer Zelle geschehen kann, 5 Pfeil "B". Damit zeigt Fig 2 Möglichkeiten für untershciedliche Pfade, längs welcher Daten aus dem Objekt B (Zelle) rechts oben zu dem untern Objekt laufen können. Bei dem unteren Objekt kann es sich z.B. um eine PAE, eine IOPAE usw. handeln. Die Fig. 3 und 4 zeigen, wie an Knotenpunkten Daten in erlaubter Weise zusammenlaufen (Fig. 3), weil dort zwischen jeder Route ein einzelner Pfadabschnit zwischen Ausgansgabelugenn (Outportsplits) und Eingangsverbindungen (Inportjoins) vorgesehen ist.

15 Es ist bevorzugt, wenn nach dem Legen der Verbindungen die maximale Latenzzeit der Konfiguration bestimmt und/oder eine dieser entsprechende Maximalfrequenz für den Konfigurationsbetrieb ermittelt wird. Diese Information kann zur Bewertung der Qualität des Konfigurationsergebnisses und/oder zur Datenverarbeitung mit der Konfiguration verwendet werden.

Bevorzugt wird auch, wenn nach Festlegung aller Signallaufwege längs aller Verbindungen ein Laufzeitausgleich für an Knoten zusammenlaufende Signale vorgenommen wird. Dies ist in der XPP-Technologie des Anmelders, für die die vorliegende Anmeldung besonders bevorzugt ist, durch das Vorsehen von Registerstufen möglich, die in die Verbindungswege, insbesondere bei Veränderung der Zellreihe, eingesetzt werden können. Es kann dabei zunächst eine Verbindung mit Register vorgesehen werden und es wird dann die zum sog. Balancing erforderliche Registerzahl bestimmt. Dieses Vorgehen bei der Plazierung und beim Routen ist besonders vorteilhaft.

Im Stand der Technik besteht nun weiter gelegentlich ein Problem, dessen wenigstens partielle Linderung in bestimmten Situationen von Vorteil wäre. Es ist nämlich oftmals die automatisch erstellte Plazierung für Rückkopplungen, also zum Beispiel für Programmschleifen, bei denen Daten von einer datenstromabwärtigen Zelle zu einer Daten zuvor bearbeitet habenden Zelle zumeist dahingehend ineffizient, dass die Rückkopplung zu weit, also der Rückkopplungsbus zu lang ist (Figur xxxf). Mit anderen Worten sind Sender und Empfänger einer Rückkopplung zu weit voneinander entfernt. Dies senkt die Verarbeitungsfrequenz rekonfigurierbarer Bausteine erheblich.

Wünschenswert ist es nun, eine Möglichkeit zu schaffen, die Anordnung und/oder Vernetzung der Zellen und/oder zellenenthaltender Bausteine zu verbessern.

Ein erster erfindungsgemäßer Ansatz schafft hier Abhilfe, indem in die langen Rückkopplungsbusse in regelmässigen Abständen Register (R) eingeführt werden (Figur xxxa), wodurch eine Art Pipelining entsteht und die Taktfrequenz entsprechend steigt, da die Übertragungszeiten zwischen den Registern deutlich kürzer ist als die Übertragungszeit direkt vom Sender zum Empfänger. Durch dieses Verfahren entsteht jedoch eine erhebliche Latenzzeit, die besonders bei Schleifen die Verarbeitungsleistung wiederum erheblich senkt.

Auch für die Wave-Reconfiguration ist es möglich, eine besonders leistungsfähige Datenverarbeitung vorzusehen, wenn nämlich direkt (also noch im selben oder einem kurz darauffolgenden Takt) nach Verarbeitung des letzten Datenwortes einer ersten Konfiguration eine zweite Rekonfiguration konfiguriert

werden kann und direkt (also noch im selben oder einem kurz darauffolgenden Takt) danach das erste Datenwort der zweiten Konfiguration verarbeitet wird.

5 Nach Figur xxua - xxuc ändert sich jedoch die Datenflußrichtung jeder nacheinanderfolgenden Konfiguration. Damit kann zwar nach jeder Verarbeitung eines letzten Datenwortes sofort die nachfolgende Konfiguration eingestellt werden, aber erst nach Rekonfiguration aller beteiligten Zellen und Busse kann 10 mit der nachfolgenden Datenverarbeitung begonnen werden (Figur xxsa). Ein erfindungsgemäßer Ansatz besteht nun darin, die Laufrichtung zwischen den Zellen weitestgehend beizubehalten und lediglich die Bussysteme der Speicher zu tauschen (Figur xxsb). Dadurch entsteht aber wiederum das vorstehend 15 bei den Rückkopplungen beschriebene Problem der langen Laufzeiten und niederen Taktraten. Auch hier könnten, wie bereits beschrieben, Register eingeführt werden, was zu einer Taktfrequenzsteigerung führen würde. Gleichzeitig entsteht aber eine nicht unerhebliche Latenzzeit, was wiederum unerwünscht sein kann.

In einer bevorzugten Variante werden daher Register durchströmte Rückkopplungsschleifen vermieden.

Es hat sich gezeigt, dass besonders gute Lösungen erzielt

werden können, wenn alle Zellen einer Schleife möglichst lokal um einen Schleifenkopf (SK) angeordnet werden und insbesondere der Schleifenfuss (SF) möglichst nahe an SK plaziert
wird (Figur xxxb, xxxd). Ebenfalls optimal ist eine schnekkenförmige Anordnung ähnlich dem Zeichen @ (Figur xxxc).

30

Es wird daher vorgeschlagen, zur Konfigurierung und/oder Rekonfigurierung eines multidimensionalen Feldes und/oder Zel-

len, für eine Datenverarbeitung, bei der Daten in Zellen verarbeitet, Verarbeitungsergebnisse an Zellen stromabwärts geleitet werden, um dort weiterverarbeitet zu werden, wobei wenigstens von einer Zelle stromabwärts Daten zu wenigstens einer Zelle stromaufwärts geführt werden, dass die Zellposition
so bestimmt wird, dass die stromabwärtige so nahe an der
stromaufwärtigen Zelle positioniert wird, daß die Rückkopplungszeit dieser Verbindung nicht größer ist als jene anderer
Verbindungen in der Konfiguration.

10

Bevorzugt kann dies typisch dadurch erreicht werden, daß die stromabwärtige Zelle näher als ¼ des gesamten Datendurchströmten Weges bei der stromaufwärtigen Zelle angeordnet ist.

Dies läßt sich insbesondere gut erreichen, wenn die datendichtesten Zellen zwischen stromauf- und stromabwärtigem Ende wendel- und/oder mäanderartig angeordnet sind.

Es gibt nun verschiedene Möglichkeiten, eine solche Rückkopp-20 lungsschleifenminimierung zu erzielen.

So können Plazierungen unter Minimierung von virtuellen Kräften zwischen Zellen und anderen Objekten vorgenommen werde, wobei dann die Rückkopplungsschleifenminimierung etwa dadurch erreicht wird, dass eine weitere "virtuelle" Federkraft eingeführt wird, die von jedem Element einer Schleife zu dem Schleifenkopf (SK) und/oder dem Schleifenfuß (SF) führt. Alternativ und/oder zusätzlich kann eine virtuelle Kraft zwischen Schleifenfuß und Schleifenkopf vorgesehen werden. Diese virtuelle Federkraft repräsentiert dabei keine Busverbindung, sondern dient lediglich der Erzielung der erfindungsgemäß Plazierungsanordnung. Insbesondere kann die virtuelle Feder-

kraft unterschiedlich zu der Federkraft von tatsächlich existierenden Busverbindungen sein. Weitere Verfahren zur automatischen Generierung der Plazierungsanordnung sind dem Fachmann entsprechend des jeweiligen Plaziererprinzipes dann offensichtlich.

Für sehr große Schleifen werden die Zellen der Schleife meanderförmig um die SK und/oder SF angeordnet (Figur xxxe) oder um SK und/oder SF gewickelt, wobei eine meanderförmige Anordnung bevorzugt wird.

10

Ein Wickel kann dadurch erzielt werden, dass die "virtuellen" Federkräfte linear oder gleichmäßig stufenweise über die Länge der Schleife hinweg abgebaut werden. Figur xxxg zeigt eine entsprechendes Beispiel, bei dem die Federkräfte stufenweise abgebaut wurden. Wickel weisen das Problem auf, dass relativ lange Busse zum Kern des Wickels (SK, SF) entstehen.

Die bevorzugte meanderförmige Anordnung kann erzielt werden,
indem den jeweiligen Zellen der Schleife periodisch höhere
und niedere "virtuelle" Federkräfte zu SK und/oder SF zugeordnet werden. Beispielsweise kann mittels einer Sinus- oder
Quasisinusfunktion eine darartige Zuordnung erfolgen. In Figur xxxe sind beispielsweise solche periodischen "virtuellen"

Federkräfte (0,1,2,3) eingetragen. Die Perioden, also die
Frequenz der Sinusfunktion sollte dabei optimal so bestimmt
werden, dass die jeweils erste Zelle nach SK und die letzte
Zelle vor SF (oder SF selbst) eine möglichst maximale Federkraft aufweisen, um diese möglichst lokal beisammen zu plazieren. Durch die Plazierung unter Definition einer virtuellen Wickelkraft können unterschiedliche Aufgaben konfiguriert
und/oder plaziert werden.

Prinzipiell sind also Verfahren anwendbar, die vorsehen, dass in ein Feld mit Zellen wählbarer Funktion die Zellposition durch Minimierung von virtuellen Kräften den Zellen bestimmt werden, wobei von Null verschiedene virtuelle Kräfte zwischen stromauf- und stromabwärtiger Zelle (SF, SK) vorgesehen werden. Es kann insbesondere im Weg zwischen stromaufwärtiger und stromabwärtiger Zelle ein Speicher, insbesondere ein Multiport-Speicher vorgesehen werden.

So wird zur Optimierung der Wave-Rekonfiguration nunmehr ein 10 entsprechendes Verfahren genutzt. Zunächst wird dabei etwa festgelegt, dass die Speicher zum Lesen von Daten und Schreiben von Daten nicht auf den gegenüberliegenden Seiten eines Arrays aus Zellen liegen, sondern entsprechend SK und SF möglichst direkt lokal beieinander liegen (Figur xxta). Bei der Durchführung einer Rekonfiguration brauchen nunmehr nur die Bussysteme zwischen den Schreib-/Lesespeichern getauscht werden. Die Busse werden dadurch nur, wenn überhaupt minimal länger, was jedoch zu keiner erheblichen Beeinträchtigung der Taktfrequenz führt (Figur xxtb). Eine weitere Optimierung kann dann dadurch erfolgen, dass zum Lesen der Daten (Operanden) und zum Schreiben der Ergebnisse dieselben Speicher benutzt werden, wobei allerdings z.B. unterschiedliche Speicherbänke oder unterschiedliche Schreib-/Lesezeiger bei FIFO-25 artigen Speicher verwendet werden, und wobei bevorzugt Mehrport-Speicher zum Einsatz kommen, die zeitgleiche Zugriffe auf mehrere Ports ermöglichen. In einer solchen, bevorzugten Variante entfällt sogar die Vertauschung der Bussysteme, da ein und derselbe Speicher verwendet wird.

Unter Anwendung dieses Prinzips ändert sich die Datenlaufrichtung gegenüber der Wave-Reconfigurationslaufrichtung nicht, wodurch eine optimale Performance erzielt wird.

Innerhalb eines Arrays können mehrere dieser Anordnungen gleichzeitig implementiert sein. In Figur xxva-xxvc ist dies für zwei Rekonfigurationszyklen beispielhaft dargestellt. Ebenfalls können entsprechende Anordnungen von mehreren Seiten des Arrays aus gleichzeitig benutzt werden. In Figur xxwa-xxwc sind zwei dementsprechende Rekonfigurationszyklen beispielhaft dargestellt.

Besonders leistungsfähig wird das Verfahren nach Figur xxx dann, wenn die Anforderungen der Wave-Reconfiguration derart

15 mitberücksichtigt werden, dass z.B. SK und/oder SF möglichst lokal zu einem Speicher (RAM) liegen sollen. Dies wird möglich, etwa indem die Schleife nur in 3 Richtungen ausgewalzt wird (Figur xxxh), was wiederum durch einen geeigneten periodischen Aufbau der "virtuellen" Federkräfte erreicht werden kann. Je nachdem ob die Federkräfte gleichmäßig auf- beziehungsweise abgebaut werden, können unterschiedliche Anordnungen erzielt werden. Das in Figur xxxh gezeigte Beispiel verwendet einen gleichmäßigen linearen langsamen Aufbau und einen schnellen linearen Abbau.

#### Patentansprüche

20

25

- 5 1. Verfahren zur Konfiguration
  für multidimensionale Felder rekonfigurierbar vernetzter
  Datenverarbeitungszellen,
  dadurch gekennzeichnet, dass benötigte Verbindungen zwischen Zellen priorisiert, dann zunächst Verbindungen, die
  eine hohe Priorität besitzen und nachfolgend weitere Verbindungen vorgesehen werden.
- Verfahren nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, dass die Verbindungen unter Berücksichtigung einer zulässigen Verzögerung bei der Datenverarbeitung priorisiert werden.
  - 3. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass eine Zellumgrenzung definiert
    und zunächst versucht wird, die Zellen über Verbindungen
    innerhalb der Umgrenzung zu verbinden.
    - 4. Verfahren dem vorhergehenden Anspruch, dadurch gekennzeichnet, dass dann, wenn nicht alle erforderlichen Verbindungen innerhalb der Umgrenzung vorgesehen werden können, eine Verbindung außerhalb der Umgebung vorgesehen
      wird.
- 5. Verfahren nach einem der beiden vorhergehenden Ansprüche, dadurch gekennzeichnet, dass dann, wenn eine weitere Verbindung nicht wie erforderlich gelegt werden kann, eine bereits vorgesehene Verbindung getrennt und die weitere

Verbindung vorgesehen wird, worauf versucht wird, einen Ersatz für die getrennte Verbindung vorzusehen.

6. Verfahren nach einem der vorhergehenden Ansprüche, worin
Verbindungen vorgesehen werden, auf welchen sich eine
Vielzahl von Ausgängen sammeln und die mit einer Vielzahl
von Eingängen verbunden sind, wobei eine Verbindung so
vorgesehen wird, dass ein Wegstück die Eingangssammelpunkte und die Ausgangsgabelungen trennt.

10

15

20

25

- 7. Verfahren nach einem der vorhergehenden. Ansprüche, dadurch gekennzeichnet, dass nach dem Legen der Verbindungen die maximale Latenzzeit der Konfiguration bestimmt und/oder eine dieser entsprechende Maximalfrequenz für den Konfigurationsbetrieb ermittelt wird.
- 8. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Priorisierung unter Berücksichtigung der maximal zulässigen Verzögerung und/oder der Verzögerungsverhältnisse unterschiedlicher Verbindungen vorgenommen wird.
- 9. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Verzögerungsverhältnisse bei der Priorisierung eine Verzögerung "0", "länger als", "länger als oder gleich zu" und "gleich zu" berücksichtigen.
- 10. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass nach Festlegung aller Signallaufwege längs aller Verbindungen ein Laufzeitausgleich
  für an Knoten zusammenlaufende Signale vorgenommen wird.

11. Verfahren zur Konfigurierung und/oder Rekonfigurierung eines multidimensionalen Feldes und/oder Zellen, für eine Datenverarbeitung, bei der Daten in Zellen verarbeitet,

5 Verarbeitungsergebnisse an Zellen stromabwärts geleitet werden, um dort weiterverarbeitet zu werden, wobei wenigstens von einer Zelle stromabwärts Daten zu wenigstens einer Zelle stromaufwärts geführt werden, dadurch gekennzeichnet, dass die Zellposition so bestimmt wird, dass die stromabwärtige so nahe an der stromaufwärtigen Zelle positioniert wird, daß die Rückkopplungszeit dieser Verbindung nicht größer ist als jene anderer Verbindungen in der Konfiguration.

- 12. Verfahren nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, dass die stromabwärtige Zelle näher als 4 des gesamten datendurchströmten Weges bei der stromaufwärtigen Zelle angeordnet ist.
- 20 13. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die datendichtesten Zellen zwischen stromauf- und stromabwärtigem Ende wendelund/oder mäanderartig angeordnet sind.
- 25 14. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass in ein Feld mit Zellen wählbarer Funktion die Zellposition durch Minimierung von virtuellen Kräften den Zellen bestimmt werden, wobei von Null verschiedene virtuelle Kräfte zwischen stromauf- und stromabwärtiger Zelle (SF, SK) vorgesehen werden.

15. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass im Weg zwischen stromaufwärtiger und stromabwärtiger Zelle ein Speicher, insbesondere ein Multiport-Speicher vorgesehen wird.

5

10

15

20

25

- 16. Verfahren zur Erzeugung von Konfigurationen für multidimensionale Felder rekonfigurierbare Zellen zur Durchführung vorgegebener Anwendungen, dadurch gekennzeichnet, daß eine Anwendung in Einzelmodule zerlegt und eine
  modulweise Plazierung der zur Durchführung erforderlichen Elemente vorgenommen wird.
- 17. Verfahren nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, daß bei der Zerlegung in Einzelmodule eine Linearisierung (Flattening) vorgenommen wird.
- 18. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß zumindest in einem Modul ortsfeste Elemente an vorgegebenen Stellen vorgesehen werden und die nichtfesten Elemente nachfolgend plaziert werden.
- 19. Verfahren nach einem der drei vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die modulweise Plazierung durch Minimierung zugewiesener virtueller Kräfte unter den einzelnen beweglichen und/oder unbeweglichen Objekten erfolgt.















Fig. 16





Tigate of 12 again conformity (no shagin part of the configuration)